D^2SD: Decodificación especulativa acelerada con difusión dual Descubre cómo D^2SD acelera la inferencia de modelos de lenguaje usando dos difusores para generar y verificar tokens en paralelo, mejorando la eficiencia. 2026-06-04 · 2 min